学习是高等动物特有的功能。从微观世界看,学习可以改变物质量子运动的随机性,使量子运动在一定情况下产生偏向性,从而改变动物行为,创造新的因果。学习使动物摆脱了只能被动接受自然选择的命运,从而在应对各种自然环境、状况时提高自身的生存机会。在自然界,学习由两种因素驱动:奖赏和惩罚。Ventral tegmental area(VTA)的多巴胺能神经元活动已被证明是重要的脑内奖赏机制。在巴普洛夫条件制约实验中,未经实验训练的动物的多巴胺系统不会对信号产生反应,但会对奖赏品(食物)产生反应。经多次反复训练后,改变发生了。此时多巴胺会对信号产生反应,而对奖赏品则不再反应。进一步量化奖赏时,多巴胺在应对更大的奖赏时会重新产生一定量的反应;而在应对更小,或失去奖赏时,多巴胺则会调低时相性活动(tonic activity)。这就是Wolfram Schultz提出的预测误差假说的基础。预测误差假说已经取得了巨大的成功。然而,到目前为止,其中一个重要的机制还没能通过实验被验证。那就是,必须存在一种神经活动用以编码即时奖赏的量度。只有奖赏量度编码的存在,多巴胺活动才能预测一定量度的奖赏,也才能比较预测量和即时量的误差,从而校正以后的预测活动。近日,Science Advances发表了耶鲁大学Marina R. Picciotto团队的研究:A direct VTA to ventral pallidum GABA pathway responds consistently to unconditioned reward across cue-outcome learning。研究在小鼠中鉴定了一个神经通路,其活动能可靠的编码奖赏量度,包括奖赏的数量(size)和质量(palatability)。另一方面,这个神经通路的编码活动很稳定,不随动物的投入精力而变化,也不随训练的时程而变化。因此,此神经通路的编码功能很可能可以为预测误差假说补上这个重要的实验证据。有意思的是,这个神经通路就是由多巴胺神经元的邻居,VTA里的GABA能神经元构建的。它们的轴突长长的延伸到ventral pallidum(VP),这个边缘神经系统的输出终端,并和VP当地的多种神经元产生突触联接。VP的一部分神经元在动物努力追求奖赏(seeking)时活动,一部分在动物获得并享用奖赏时活动。研究发现,当刺激VTA至VP的GABA通路时,更多的神经元参与到追求奖赏的活动中,而不是享用奖赏的活动中。这给研究者以启示:VTA至VP的GABA通路的活动不仅仅提供奖赏量度的编码,而且可能提供一种提高积极性(motivation)的神经机制。而通常认为,积极性也是由纹状体(striatum)内的多巴胺水平决定的。在行为实验验证了这一想法。刺激VTA至VP的GABA通路可以显著提高动物追求奖赏的积极性,并加快动物学习应对奖赏信号,提高获得奖赏的效率。奖赏物的出现和享用会同时开启VTA内的多巴胺和GABA神经活动。VTA至VP的GABA活动为多巴胺的预测编码提供奖赏量度的参照;另一方面多巴胺投射到纹状体参与直接/间接通路的调节,最终汇入VP并输出;VTA GABA则直接投射到VP,与多巴胺下游信号汇合,共同调节边缘神经系统的功能。由此,这项工作为揭示脑内全面的奖赏机制向前推进了一步。原文链接:
http://doi.org/10.1126/sciadv.abm5217
制版人:十一
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。